智能论文笔记

A machine learning based approach to gravitational lens identification with the International LOFAR Telescope

S. Rezaei , J. P. McKean , M. Biehl , W. de Roo1 , A. Lafontaine

分类：机器学习

2022-07-21

我们提出了一种基于机器学习的新型方法，用于从干涉数据中检测出星系尺度的重力透镜，特别是使用国际Lofar望远镜（ILT）采用的方法，该镜头是在150 MHz的频率上观察到北部无线电天空，该频率是350的角度分辨率。 MAS和90 Ujy Beam-1（1 Sigma）的灵敏度。我们开发并测试了几个卷积神经网络，以确定给定样品被归类为镜头或非镜头事件的概率和不确定性。通过对包括逼真的镜头和非镜头无线电源的模拟干涉成像数据集进行训练和测试，我们发现可以恢复95.3％的镜头样品（真正的正速率），仅污染仅为0.008来自非静态样品（假阳性速率）的含量。考虑到预期的镜头概率，结果导致了92.2％的镜头事件的样品纯度。我们发现，当镜头图像之间的最大图像分离大于合成光束尺寸的3倍时，网络结构是最健壮的，并且镜头图像具有至少与20个Sigma（点源）的总磁通密度相等）检测。对于ILT，这对应于爱因斯坦半径大于0.5 ARCSEC和一个无线电源群体的镜头样品，其150 MHz通量密度超过2 MJY。通过应用这些标准和我们的镜头检测算法，我们希望发现Lofar两米天空调查中包含的绝大多数星系尺度重力透镜系统。

translated by 谷歌翻译

De novo PROTAC design using graph-based deep generative models

Divya Nori , Connor W. Coley , Rocío Mercado

分类：人工智能 | 机器学习

2022-11-04

PROteolysis TArgeting Chimeras (PROTACs) are an emerging therapeutic modality for degrading a protein of interest (POI) by marking it for degradation by the proteasome. Recent developments in artificial intelligence (AI) suggest that deep generative models can assist with the de novo design of molecules with desired properties, and their application to PROTAC design remains largely unexplored. We show that a graph-based generative model can be used to propose novel PROTAC-like structures from empty graphs. Our model can be guided towards the generation of large molecules (30--140 heavy atoms) predicted to degrade a POI through policy-gradient reinforcement learning (RL). Rewards during RL are applied using a boosted tree surrogate model that predicts a molecule's degradation potential for each POI. Using this approach, we steer the generative model towards compounds with higher likelihoods of predicted degradation activity. Despite being trained on sparse public data, the generative model proposes molecules with substructures found in known degraders. After fine-tuning, predicted activity against a challenging POI increases from 50% to >80% with near-perfect chemical validity for sampled compounds, suggesting this is a promising approach for the optimization of large, PROTAC-like molecules for targeted protein degradation.

translated by 谷歌翻译

Graph Neural Networks for Low-Energy Event Classification & Reconstruction in IceCube

R. Abbasi , M. Ackermann , J. Adams , N. Aggarwal , J. A. Aguilar , M. Ahlers , M. Ahrens , J. M. Alameddine , A. A. Alves Jr. , N. M. Amin

分类：机器学习

2022-09-07

ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列，该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战，这是由于探测器的几何形状，不均匀的散射和冰中光的吸收，并且低于100 GEV的光，每个事件产生的信号光子数量相对较少。为了应对这一挑战，可以将ICECUBE事件表示为点云图形，并将图形神经网络（GNN）作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开，对不同的中微子事件类型进行分类，并重建沉积的能量，方向和相互作用顶点。基于仿真，我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术，包括已知系统不确定性的影响。对于中微子事件分类，与当前的IceCube方法相比，GNN以固定的假阳性速率（FPR）提高了信号效率的18％。另外，GNN在固定信号效率下将FPR的降低超过8（低于半百分比）。对于能源，方向和相互作用顶点的重建，与当前最大似然技术相比，分辨率平均提高了13％-20％。当在GPU上运行时，GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件，这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。

translated by 谷歌翻译

Study of Novel Sparse Array Design Based on the Maximum Inter-Element Spacing Criterion

W. Shi , Y. Li , R. C. de Lamare

分类：机器学习

2022-08-20

基于最大元素间间距（IES）约束（MISC）标准，提出了一种新型的稀疏阵列（SA）结构。与传统的MISC阵列相比，所提出的SA配置称为改进的MISC（IMISC），显着提高了均匀的自由度（UDOF）并减少了相互耦合。特别是，IMISC阵列由六个均匀的线性阵列（ULA）组成，可以由IES集确定。IES集受两个参数的约束，即最大IE和传感器数。也得出了IMISC阵列的UDOF，并且也分析了IMISC阵列的重量函数。拟议的IMISC阵列在对现有SAS的UDOF方面具有很大的优势，而它们的相互耦合保持低水平。进行模拟以证明IMISC阵列的优势。

translated by 谷歌翻译

Where is VALDO? VAscular Lesions Detection and segmentatiOn challenge at MICCAI 2021

Carole H. Sudre , Kimberlin Van Wijnen , Florian Dubost , Hieab Adams , David Atkinson , Frederik Barkhof , Mahlet A. Birhanu , Esther E. Bron , Robin Camarasa , Nish Chaturvedi

分类：计算机视觉 | 人工智能

2022-08-15

脑小血管疾病的成像标记提供了有关脑部健康的宝贵信息，但是它们的手动评估既耗时又受到实质性内部和间际变异性的阻碍。自动化评级可能受益于生物医学研究以及临床评估，但是现有算法的诊断可靠性尚不清楚。在这里，我们介绍了\ textIt {血管病变检测和分割}（\ textit {v textit {where valdo？}）挑战，该挑战是在国际医学图像计算和计算机辅助干预措施（MICCAI）的卫星事件中运行的挑战（MICCAI） 2021.这一挑战旨在促进大脑小血管疾病的小而稀疏成像标记的自动检测和分割方法的开发，即周围空间扩大（EPVS）（任务1），脑微粒（任务2）和预先塑造的鞋类血管起源（任务3），同时利用弱和嘈杂的标签。总体而言，有12个团队参与了针对一个或多个任务的解决方案的挑战（任务1 -EPVS 4，任务2 -Microbleeds的9个，任务3 -lacunes的6个）。多方数据都用于培训和评估。结果表明，整个团队和跨任务的性能都有很大的差异，对于任务1- EPV和任务2-微型微型且对任务3 -lacunes尚无实际的结果，其结果尤其有望。它还强调了可能阻止个人级别使用的情况的性能不一致，同时仍证明在人群层面上有用。

translated by 谷歌翻译

QA Is the New KR: Question-Answer Pairs as Knowledge Bases

Wenhu Chen , William W. Cohen , Michiel De Jong , Nitish Gupta , Alessandro Presta , Pat Verga , John Wieting

分类：人工智能

2022-07-01

在该职位论文中，我们提出了一种新方法，以基于问题的产生和实体链接来生成文本的知识库（KB）。我们认为，所提出的KB类型具有传统符号KB的许多关键优势：尤其是由小型模块化组件组成，可以在组合上合并以回答复杂的查询，包括涉及“多跳跃”的关系查询和查询。“推论。但是，与传统的KB不同，该信息商店与常见的用户信息需求相符。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Tethered Power for a Series of Quadcopters: Analysis and Applications

Karan P. Jain , Prasanth Kotaru , Massimiliano de Sa , Koushil Sreenath , Mark W. Mueller

分类：机器人

2022-03-15

束缚的四型旋转器用于扩展飞行操作，其中通过连接到外部电源的系绳提供了系统的电源。在这项工作中，我们考虑了由单个系绳动力的多个四轮驱动器组成的系统。我们研究影响功率需求的设计因素，例如系绳的电阻，输入电压和四轮驱动器的位置。我们提出了一项分析，以预测为每个Quadcopter的推力提供的一系列n系二极管的所需功率，以确保电气安全性并有助于设计优化。我们发现，由于基本电气限制，推力的临界边界无法超过。我们比较了一个束缚的四轮驱动器和两个束缚四轮驱动器的功耗，并表明，对于距锚点足够远的大型四轮驱动器，一个二极管系统会消耗较小的功率。我们表明，对于一种代表性的消防用例，一个具有两个四轮驱动器的束缚系统比带有一个四轮驱动器的相应系统少消耗26％的功率。最后，我们提出了实验，证明了在混乱的环境中与一四分之一的束缚系统相比，使用两四分之一的束缚系统，例如穿过窗户并将物体抓住障碍物。

translated by 谷歌翻译

Preserving Domain Private Representation via Mutual Information Maximization

Jiahong Chen , Jing Wang , Weipeng Lin , Kuangen Zhang , Clarence W. de Silva

分类：机器学习 | 计算机视觉

2022-01-09

无监督域适应的最新进步已经表明，通过提取域不变表示来缓解域分流可以显着改善模型的概括到未标记的数据域。然而，现有方法未能有效保留私有的标签缺失域的表示，这可能会对概括产生不利影响。在本文中，我们提出了一种保留这种表示的方法，使得未标记域的潜在分布可以代表域不变的功能和私有到未标记域的各个特征。特别地，我们证明，在减轻域分歧的同时最大化未标记的域和其潜空间之间的相互信息可以实现这种保存。我们也理论上和经验验证的验证验证，保留私有到未标记的域的表示是重要的，并且是跨域泛化的必要性。我们的方法优于几个公共数据集上的最先进的方法。

translated by 谷歌翻译

Improving language models by retrieving from trillions of tokens

Sebastian Borgeaud , Arthur Mensch , Jordan Hoffmann , Trevor Cai , Eliza Rutherford , Katie Millican , George van den Driessche , Jean-Baptiste Lespiau , Bogdan Damoc , Aidan Clark

分类：自然语言处理 | 机器学习

2021-12-08

我们通过与与前面令牌的局部相似度，通过调节从大语料库检索的文档块来增强自动回归语言模型。尽管使用25美元\时分，我们的检索增强型变压器（RetroCro）的检索增强型变压器（RetroCr）对GPT-3和侏罗纪-1获得了可比性的性能。微调后，复古表演转换为下游知识密集型任务，如问题应答。复古结合了冷冻BERT猎犬，一种可微分的编码器和块状的横向机制，以预测基于数量级的令牌，而不是训练期间通常消耗的数量。我们通常从头开始训练复古，还可以快速改造预先接受的变压器，通过检索，仍然达到良好的性能。我们的工作通过以前所未有的规模开辟了通过显式内存改进语言模型的新途径。

translated by 谷歌翻译